分布函数

Distribution

概率的函数,可以描述任何类型的随机变量
完整地描述了随机变量的统计规律性,表示了概率分布情况

一、分布函数基础

1. 基本定义

X随机变量x 为任意实数,则函数 F(x)=P{Xx} 称为 X分布函数
X 服从 F(x),记为 XF(x)

P{x1<Xx2}=P{Xx2}{Xx1}=F(x2)F(x1)

2. 基本性质

满足上述三条性质的函数,必为某一随机变量的分布函数

二、常用分布

1. 离散分布

概率质量函数 的累加

二项分布:描述n次独立伯努利试验中成功次数的概率分布
超几何分布:描述不放回抽样中成功次数的概率分布
几何分布:描述首次成功所需的伯努利试验次数的概率分布
泊松分布:描述单位时间或空间内稀有事件发生次数的概率分布

2. 连续分布

概率密度函数的积分

正态分布:对称的钟形分布,广泛用于自然和社会现象的建模
均匀分布:所有可能结果在区间内概率均等的分布
指数分布:描述泊松过程中事件间隔时间的分布
伽马分布:描述多个独立指数事件发生所需时间的分布
抽样分布:统计量的概率分布,用于推断总体参数

注意

  1. 记特殊分布时,一般记忆的是特殊分布的 分布律/密度函数;求分布函数时,对其累加/积分 即可得到对应的分布函数
  2. 千万要注意密度函数分段表达:求分布函数时,注意对应的积分上下限

3. 随机变量函数的分布函数

见:随机变量函数的分布

三、扩展知识

世界是对数的吗?

轻尾分布:有界、聚集,例如正态分布,几乎不可能产生较大的样本。当趋于无穷时,概率越来越小。如果已知一个数很大,那么几乎有很小的概率更大

P(x>t+a)P>t0,t

长尾分布:有显著的概率产生很大的样本
二八定律、幂律定律,帕累托分布、对数正态分布。当趋于无穷时,概率越来越保持一致,“尾巴越来越长”, 如果已知一个数很大,那么实际有很大的概率更大!

P(x>t+a)P>t1,t

产生的原因:最终量的形成来自于一系列独立变量的乘积,而非加和
(例如财富、粉丝数)

对数正态分布:在对数尺度下,为正态分布
(实际上正是对数运算,将一系列乘积转为加和,也就将长尾分布转为轻尾分布)

X=X0X1XnlnX=lnX1++lnXn

本福特定律:首位 1 的主导性,
log1020.301